Méthodes pour la représentation informatisée de données lexicales / Methoden der Speicherung lexikalischer Daten

نویسندگان

  • Laurent Romary
  • Andreas Witt
چکیده

In recent years, new developments in the area of lexicography have altered not only the management, processing and publishing of lexicographical data, but also created new types of products such as electronic dictionaries and thesauri. These expand the range of possible uses of lexical data and support users with more flexibility, for instance in assisting human translation. In this article, we give a short and easy-to-understand introduction to the problematic nature of the storage, display and interpretation of lexical data. We then describe the main methods and specifications used to build and represent lexical data. This paper is targeted for the following groups of people: linguists, lexicographers, IT specialists, computer linguists and all others who wish to learn more about the modelling, representation and visualization of lexical knowledge. This paper is written in two languages: French and German.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

SVM et visualisation pour la fouille de grands ensembles de données

Résumé. Nous présentons un algorithme de SVM et des méthodes graphiques pour le traitement de grands ensembles de données. Pour pouvoir traiter de tels ensembles de données, nous utilisons une représentation des données de plus haut niveau (sous forme symbolique). L’algorithme de séparateur à vaste marge (SVM) est adapté pour pouvoir traiter ce nouveau type de données. Nous construisons un nouv...

متن کامل

Plongement incrémental dans un contexte de dissimilarité

RÉSUMÉ. Le domaine de la reconnaissance statistique de formes est basé sur la représentation numérique des objets et peut donc être facilement combiné avec des méthodes d’apprentissage automatique. D’autre part, la reconnaissance structurelle de formes utilise un ensemble limité de méthodes d’apprentissage automatique mais encode une riche description des objets via les chaînes de caractères ou...

متن کامل

Une représentation des arborescences pour la recherche de sous-structures fréquentes

Résumé. La recherche de structures fréquentes au sein de données arborescentes est une problématique actuellement très active qui trouve de nombreux intérêts dans le contexte de la fouille de données comme, par exemple, la construction automatique d’un schéma médiateur à partir de schémas XML. Dans ce contexte, de nombreuses propositions ont été réalisées mais les méthodes de représentation des...

متن کامل

Représentation des données par un comité de cartes auto-organisatrices : une application aux données bruitées

Résumé. Grâce aux approches ensemblistes, les performances en apprentissage supervisé sont devenues excellentes sans pour autant être trop coûteuses en temps. Cependant, ces méthodes ne permettent que la prédiction des données. Or, le couplage entre la prédiction et une méthode de représentation ajoute une valeur qualitative. La représentation permet de redonner la main à l’utilisateur, que ce ...

متن کامل

La combinaison d'UML avec la méthode formelle CSP-OZ pour le développement d'applications bases des données

Les méthodes utilisées pour la spécification et le développement d’applications de bases de données sont basées soit sur les notations graphiques (appelées méthodes semi-formelles) soit sur des notations mathématiques (appelées méthodes formelles). Les méthodes semi-formelles (E-R, UML, OMT,...) (Jacobson et al., 2005) permettent une représentation intuitive et synthétique du système à étudier....

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • CoRR

دوره abs/1405.3925  شماره 

صفحات  -

تاریخ انتشار 2014